Method of Profanity Detection Using Word Embedding and LSTM
نویسندگان
چکیده
With the rising number of Internet users, there has been a rapid increase in cyberbullying. Among types cyberbullying, verbal abuse is emerging as most serious problem, for preventing which profanity being identified and blocked. However, users employ words cleverly to avoid blocking. existing discrimination methods, deliberate typos using special characters can be discriminated with high accuracy. they cannot grasp meaning flow sentences, standard such “Sibaljeom (starting point, Korean word that sounds similar swear word)” “Saekkibalgalag (little toe, another are less accurately discriminated. Therefore, order solve this study proposes method discriminating deep learning model context after separating Hangul into onset, nucleus, coda.
منابع مشابه
chemical recycling of polycarbonate waste using conventional heating and microwave assisted method
پلی کربنات یکی از پلاستیکهای مهمی است که به صورت گسترده در تولید لوحهای فشرده، قطعات رایانه، مواد ساختمانی و غیره مورد استفاده قرار می گیرد. این پلیمر بصورت عمده از تراکم مونومر بیس فنولa (bpa) و کربنیل کلرید یا دی متیل کربنات ها بدست می آید. در سالهای اخیر بازیافت شیمیایی پلی کربنات بیشتر مورد توجه بوده است. بازیافت شیمیایی پلی کربنات برای بدست آوردن مواد اولیه آن با روشهای متفاوتی مانند تجزی...
Using Crowdsourcing to Improve Profanity Detection
Profanity detection is often thought to be an easy task. However, past work has shown that current, list-based systems are performing poorly. They fail to adapt to evolving profane slang, identify profane terms that have been disguised or only partially censored (e.g., @ss, f$#%) or intentionally or unintentionally misspelled (e.g., biatch, shiiiit). For these reasons, they are easy to circumve...
متن کاملWord Embedding-based Antonym Detection using Thesauri and Distributional Information
This paper proposes a novel approach to train word embeddings to capture antonyms. Word embeddings have shown to capture synonyms and analogies. Such word embeddings, however, cannot capture antonyms since they depend on the distributional hypothesis. Our approach utilizes supervised synonym and antonym information from thesauri, as well as distributional information from large-scale unlabelled...
متن کاملNegative-Sampling Word-Embedding Method
The word2vec software of Tomas Mikolov and colleagues has gained a lot of traction lately, and provides state-of-the-art word embeddings. The learning models behind the software are described in two research papers [1, 2]. We found the description of the models in these papers to be somewhat cryptic and hard to follow. While the motivations and presentation may be obvious to the neural-networks...
متن کاملbuckling of viscoelastic composite plates using the finite strip method
در سال های اخیر، تقاضای استفاده از تئوری خطی ویسکوالاستیسیته بیشتر شده است. با افزایش استفاده از کامپوزیت های پیشرفته در صنایع هوایی و همچنین استفاده روزافزون از مواد پلیمری، اهمیت روش های دقیق طراحی و تحلیل چنین ساختارهایی بیشتر شده است. این مواد جدید از خودشان رفتارهای مکانیکی ارائه می دهند که با تئوری های الاستیسیته و ویسکوزیته، نمی توان آن ها را توصیف کرد. این مواد، خواص ویسکوالاستیک دارند....
ذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ژورنال
عنوان ژورنال: Mobile Information Systems
سال: 2021
ISSN: ['1875-905X', '1574-017X']
DOI: https://doi.org/10.1155/2021/6654029